查看原文
其他

AlphaGo归来,人类已溃不成军

2017-01-05 科学人 科学人

编者按

自1月2日起,短短的3天时间内,围棋AI“Master”已获60连胜,战胜了包括柯洁、古力、聂卫平在内的几乎所有顶尖人类棋手。“棋风怪异,招式狠辣,连战连胜”, 在我们纷纷猜测这神秘AI来自何处时,昨日21时,Master终于给出了回应。“我就是AlphoGo”。




昨晚,DeepMind官方发布新闻稿,证实AlphaGo归来。图片来源:Deepmind.


2016年,DeepMind研制的人工智能程序AlphaGo战胜围棋世界冠军、韩国名将李世乭。那时,人类曾赢下了一局。不到一年的时间,AlphaGo变得更快更强,人类却已溃不成军。新的AlphoGo有多厉害?Master能否战无不胜?与AlphoGo相比,Master强在哪里?科学人邀请多位计算机科学家进行讨论,一起来聊聊这重新归来的AlphaGo。


天下武功 
唯快不破


Master是一个不折不扣的快棋高手。职业围棋九段,国家围棋队总教练俞斌在“分答”中表示:“Master和我们的顶尖高手下的都是30秒以下的快棋,我们跟它约30秒以上的棋它是不接受的,它这次来好像就是测试快棋的实力的。”

科学人: 为什么Master只下快棋?会有什么可能的用意?

张峥(上海纽约大学计算机科学教授):快慢是相对的,对狗狗系来说人的时钟太慢。 


余凯(地平线机器人科技创始人兼CEO,前百度研究院副院长)计算机算法的能力是用求解时间来决定的,能下快棋,说明Ai的算法能力得到了显著提升。 

俞扬(南京大学副教授,AI专家):下快棋是很难的,仅说机器一方,目前的博弈算法都包含有搜索,搜得多看得远就下得更好,国际象棋的深蓝是纯靠搜索。AlphaGo一方面使用了改进的搜索算法,另一方面引入了深度神经网络,减少了对搜索量的需求,但是还是要搜。搜索的弊端就是耗时,因此下得快是对算法博弈的巨大挑战。

Master在下快棋方面十分厉害,相较于AlphaGo在技术上肯定有改变,最直接的手段是计算加快,例如使用更新的计算设备。另一种手段是改进算法,提高深度神经网络的能力,进一步减小需要的搜索量,包括:1. 目前已经有一些性能更好的网络结构,如ResNet;2. 强化学习的算法得到了改进,如TRPO;3. 强化学习自博弈算法得到了改进,如FSP。

缪文(富士通研发中心研究员,中科院、德国马普学会计算神经科学博士):快棋对AI算法的影响比较小,计算10秒和计算1分钟这两者之间的结果绝大部分可能是一样是。而对于人类来说,快棋状态下更倾向走定式棋而且更容易犯错,定式对于AI来说是比较容易应对的,毕竟算法训练的数据来源很多都是定式。快棋策略让Master有更大的赢面。

Master更强更厉害


在2016年3月那场举世瞩目的人机大战中,AlphaGo以4:1大比分战胜了世界围棋冠军、韩国名将李世乭九段。比赛中,AlphaGo的棋技并非无懈可击,“有些落子目的不明,有些是大昏招(甚至白白送子给对方吃),似乎在刻意避免打劫……并且,毕竟还是输掉了一局。”然而短短9个月后,化身“Master”卷土重来的阿尔法狗,几乎已经无人能胜。


Master对战柯洁的棋局记录。 

科学人:“Master”和去年的“AlphaGo”有什么区别?是更新了计算设备,还是有了更强的算法? 

张峥(上海纽约大学计算机科学教授):我看到了关于Master的一些新闻,但并不十分关心。我觉得相对于AlphaGo,Master的搜索速度更快、计算效率更高,也许本质上还是原来的东西,只是更厉害了,厉害到让我们觉得是另外一个东西。量变的幅度大到对我们来说是质变的感觉。算法和设备的增强应该都有。

余凯(地平线机器人科技创始人兼CEO,前百度研究院副院长):上次AlphaGo战胜李世乭,关于人类是否能战胜AI这事就已经有定论了。因为计算机棋力只会提升得更快,肯定是横扫所有人类旗手。这次Master下的是快棋,而且表现非常稳定,水平超过了AlphaGo。在技术角度,Master肯定是算法有显著提升,因为上次DeepMind就用了GPU集群,一年之内硬件进展没有那么快。 

俞扬(南京大学副教授,AI专家):无疑Master更厉害,在相同的时间下,如果快棋下得更好,慢棋也肯定能胜过AlphaGo。关于是更新了计算设备,还是有了更强的算法,我觉得两者应该都有。

缪文(富士通研发中心研究员,中科院、德国马普学会计算神经科学博士):AlphaGo已经验证了Google的方法可行性,Master 应该是一个优化版,主要是采用了更优化的学习策略并大大减少计算能力的消耗。AlphaGo和Master前后时间差异近一年,这个时间对于改进这两个方面是足够的。 

不会战无不胜,
但会战(人)无不胜


相比去年AIphaGo战胜李世石的举世瞩目,Master的战无不胜似乎只在围棋圈内进行传播。面对围棋AI的胜利,我们似乎已经欣然接受。AlphaGo每天可以和自己下数百万盘棋,而国际围棋联盟估计全世界的围棋棋手大约也只有四千万。随着AIphaGo计算性能的提升和其他人工智能的兴起,迟早有一天,绝大多数曾存在过的棋局都会出自程序之手。

科学人:从目前来看,您觉得Master会战无不胜么?

张峥(上海纽约大学计算机科学教授):不会战无不胜,但会战(人)无不胜。

余凯(地平线机器人科技创始人兼CEO,前百度研究院副院长):战无不胜是肯定的。

俞扬(南京大学副教授,AI专家):围棋博弈存在最优策略,从60连胜看,Master已经远比人更接近最优,只有更逼近最优策略的才能战胜Master,不知道会不会有人在与Master对战多局后做到这一点。换句话说,我们其实不了解人,了解Master更容易得多。

缪文(富士通研发中心研究员,中科院、德国马普学会计算神经科学博士):在目前情况下我觉得Master会战无不胜,而且不光如此,在现有的技术下,可定义规则和量化结果的场景,理论上AI都能超越人类的表现。这种情况在学术界已经出现多年了,刚刚被公众感知到可能还难以接受。

(编辑:Sol_阳阳、婉珺;排版:Sol_阳阳)



阿尔法狗之后将会如何发展?

欢迎留言本文文末给出你的见解



本文来自果壳网,谢绝转载

如有需要请联系sns@guokr.com

科学人
科研最新进展,学术最新动态,顶级学者的思考和见解。长按二维码关注科学人(微信号:scientific_guokr)。


点击“阅读原文”

回顾去年阿狗如何打败李世乭




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存